相当于 PyQuery 或 Nokogiri 的 PHP?
全部标签 我使用Mechanize登录到网页/servlet。我有一个页面对象:jobShortListPg=agent.get(addressOfPage)当我使用时:putsjobShortListPg我得到了我不想要的页面的“Mechanize”版本:#如何获取页面的HTML源代码? 最佳答案 使用.body:putsjobShortListPg.body 关于ruby-如何使用Mechanize/Nokogiri获取页面源,我们在StackOverflow上找到一个类似的问题:
你会选择哪一个?我的重要属性是(排名不分先后):支持和future的改进。社区和一般知识库(在Internet上)。全面(即,证明可以解析范围广泛的*.*ml页面)。表现。内存占用(运行时,而不是代码库)。 最佳答案 选择Nokogiri,对于所有要点,尤其是第一点:Hpricot是nolongermaintained.元答案:参见ruby-toolbox了解不同工具在特定领域的流行程度。 关于ruby-NokogirivsHpricot?,我们在StackOverflow上找到一个类似
我正在使用Nokogiri::XML来解析来自AmazonSimpleDB的响应。响应类似于:Foo42BarXYZ如果我直接将响应交给Nokogiri,所有XPath查询(例如doc/"//Item/Attribute[Name='Foo']/Value")都会返回一个空数组。但是,如果我从SelectResponse标记中删除xmlns属性,它就可以正常工作。我需要做一些额外的事情来解释命名空间声明吗?这种解决方法感觉非常像黑客攻击。 最佳答案 该XPath查询查找不在任何命名空间中的元素。您需要告诉您的XPath处理器您正在寻
例如在python中,可以将方法分配给变量:classMyClassdefmyMethod(self):return"Hi"x=MyClass()method=x.myMethodprintmethod()#printsHi我知道这在Ruby中应该是可能的,但我不知道语法是什么。 最佳答案 您需要使用method以方法名称作为参数来获取该方法。这将返回一个Method类型的实例,可以用call()调用它。classMyClassdefmyMethod"Hi"endendx=MyClass.newm=x.method(:myMetho
我还没有找到任何文档或教程。有没有这样的东西?doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')上面的代码将在任何地方为我提供任何表,它有一个tbody子级,其属性id等于“threadbits_forum_251”。但是为什么要以双//开头呢?为什么最后会有/tr?有关详细信息,请参阅“RubyNokogiriParsingHTMLtableII”。谁能告诉我如何提取href、id、alt、src等,使用野切?td[3]/div[1]/a/text()'如何提取其他东西? 最佳答案
我正在使用Nokogiri从页面中提取链接,但我想获得绝对路径,即使页面上的链接是相对路径。我怎样才能做到这一点? 最佳答案 Nokogiri是无关的,除了它为您提供链接anchor这一事实。使用Ruby的URI管理路径的库:absolute_uri=URI.join(page_url,href).to_s实际可见:require'uri'#TheURLofthepagewiththelinkspage_url='http://foo.com/zee/zaw/zoom.html'#Avarietyoflinkstotest.href
给定:require'rubygems'require'nokogiri'value=Nokogiri::HTML.parse(AFooBCBarDEF"HTML_END我想做一些我可以在Hpricot中做的事情:divs=value.search('//div[@id^="para-"]')如何对XPath样式的元素进行模式搜索?我在哪里可以找到对我有帮助的文档?我没有在rdoc中看到这个。 最佳答案 使用xpath函数starts-with:value.xpath('//p[starts-with(@id,"para-")]')
我正在使用Nokogiri和open-uri来抓取网页上标题标签的内容,但在处理重音字符时遇到了问题。处理这些问题的最佳方法是什么?这是我正在做的:require'open-uri'require'nokogiri'doc=Nokogiri::HTML(open(link))title=doc.at_css("title")此时,标题看起来是这样的:Rag\303\271代替:Ragù我怎样才能让nokogiri返回正确的字符(例如本例中的ù)?这是一个示例网址:http://www.epicurious.com/recipes/food/views/Tagliatelle-with-
我刚刚更新到OSXMountainLion,在使用rails和终端时我得到了以下信息。WARNING:NokogiriwasbuiltagainstLibXMLversion2.8.0,buthasdynamicallyloaded2.7.8我看过类似问题的其他答案,但它们似乎并没有阻止警告消息的出现。 最佳答案 我在ruby1.9.2上安装nokogirigem时遇到了类似的问题显然Apple升级了gcc...我用符号链接(symboliclink)修复了这个问题,然后gem安装得很好:sudoln-s/usr/bin/gcc
我希望能够获得平均值、中位数、百分位数等。我一直在寻找,但找不到类似的东西。我意识到Ruby在科学界并没有被广泛使用,但至少在Ruby中必须存在一个非常基本的数学库,对吧? 最佳答案 rubynarray怎么样?http://narray.rubyforge.org/如果您查看方法,有一个统计部分涵盖了您的用例:http://narray.rubyforge.org/SPEC.en您可能还想查看GSL的ruby绑定(bind):http://ruby-gsl.sourceforge.net/